Welcome to pandas!

2.4导入外部数据为表格时修改属性

在读取外部数据为DateFrame表格时,也可能会修改一些相关信息,我们以读取Excel文件为例,

使用的是pd.read_excel()函数,可能会指定索引列数据,则使用header参数,

如果指定行索引数据, 则使用index_col参数;如果要设置各列数据类型,则使用dtype参数。


2.4.1 header参数

import pandas as pd

path = r "D:\Pyobject2023\object\测试\测试素材2.xlsx"

df = pd.read_excel(path)

print (df)

返回:

21年业绩表 Unnamed: 1 Unnamed: 2

0 姓名 部门 销售额
1 小胡 销售1部 250000
2 小张 销售1部 360000
3 小曾 销售2部 280000
4 小李 销售2部 490000

import pandas as pd

path = r "D:\Pyobject2023\object\测试\测试素材2.xlsx"

df = pd.read_excel(path, header = 1 )

print (df)

返回:

姓名 部门 销售额
0 小胡 销售1部 250000
1 小张 销售1部 360000
2 小曾 销售2部 280000
3 小李 销售2部 490000

2.4.2 header和index_col参数

import pandas as pd

path = r "D:\Pyobject2023\object\测试\测试素材2.xlsx"

df = pd.read_excel(path,

header = 1 ,

index_col = 0 , #设置0列即姓名名为行索引

dtype ={ "部门":"str","销售额":"float" }) #设置部门列的数据为字符型,销售额的数据为双精度数据型

print (df)

返回:

部门 销售额
姓名
小胡 销售1部 250000.0
小张 销售1部 360000.0
小曾 销售2部 280000.0
小李 销售2部 490000.0